<html lang="es"><head><meta content="text/html; charset=utf-8" http-equiv="Content-Type"> <link rel="stylesheet" href="http://www.google.com/google.css"> <link rel="stylesheet" href="../leftnav.css"> <style>
<!--
body,td,font,p,a{font-family:arial,sans-serif}
.i { margin-left: 1em; margin-right: 2em; }
//.style1 {font-weight: bold}
.style1 {font-weight: bold}
.d {color:#999999;text-decoration:italics;font-size:10px;}
.changes {color: #FF0000}
-->
</style> <script src=" https://ssl.google-analytics.com/urchin.js " type="text/javascript">
</script> <script type="text/javascript">
  _uacct="UA-18009-2";
  _utcp="/webmasters/sitemaps/";
  _uanchor=1; 
  urchinTracker();
</script>  <title>Herramientas para webmasters de Google</title> </head> <body class="search" bgcolor="#ffffff" text="#000000" link="#0000CC" vlink="#800080" alink="#ff0000" topmargin="3"> <table width="95%" border="0" cellpadding="0" cellspacing="2">  <tr valign="top">  <td width="1%"><a href="https://www.google.com/webmasters/sitemaps/"> <img src="http://www.google.com/images/google_sm.gif" hspace="15" height="59" width="143" vspace="5" alt="Volver a la página principal de Google." border="0"></a></td>  <td width="100%" valign="middle">  <table width="100%" border="0" cellspacing="0" cellpadding="0">  <tr>  <td><font size="+0"><b>Herramientas para webmasters</b></font></td>  </tr>  <tr>  <td style="border-bottom:1px solid #999999" height="1"><img width="1" height="1" alt=""></td>  </tr>  </table>  </td>  </tr> </table> <table border="0" cellpadding="2" cellspacing="0" width="95%">  <tr>  <td width="175" valign="top">  <font size="-1">  <p class="sidenavlink"><a href="about.html">Acerca de Herramientas para webmasters de Google</a></p>  <p class="sidenavlink"><a href="protocol.html">Utilización del Protocolo Sitemap</a></span><p class="sidenavtoc">Utilización del Generador Sitemap</p> <p class="sidenavlink"><a href="http://www.google.com/webmasters/">Centro para webmasters de Google</a></p>  </font></td>  <td background="http://www.google.com/images/dot2.gif" valign="bottom" width="5"><img src="http://www.google.com/images/dot2.gif" width="1" height="1"></td>  <td style="background-color: #ffffff" width="10" valign="top"><img src="http://www.google.com/images/cleardot.gif" width="10" height="1"></td>  <td>  <div class="content">   <p><strong>Índice</strong></p>  <p><font size="-1"><a href="#before">Antes de comenzar</a><br><a href="#download">Descarga de los archivos de programa del Generador Sitemap</a><br><a href="#config">Creación de un archivo de configuración</a><br><a href="#copy">Carga de los archivos a su servidor web</a><br><a href="#execute">Ejecución de la secuencia de comandos del Generador Sitemap</a><br><a href="#submitting">Envío de su Sitemap a Google</a><br><a href="#troubleshoot">Solución de problemas</a>  </font></p>  <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="before"></a><b>Antes de comenzar</b></td>  </tr>  </tbody></table>  <p><font size="-1"> El Generador Sitemap es una secuencia de comandos Python que crea un Sitemap para su sitio usando el protocolo Sitemap. Esta secuencia de comandos puede crear Sitemaps a partir de listas de URL, directorios de servidores web y registros de acceso. Para poder usar esta secuencia de comandos: </font></p>   <ul>  <li><font size="-1">Debe poder conectarse y ejecutar secuencias de comandos en su servidor web. </font></li>  <li><font size="-1">Su servidor web debe tener instalado Python 2.2 o una versión posterior. </font></li>  <li><font size="-1">Debe conocer el comando que inicia Python. (Generalmente es <strong>python</strong>, pero puede variar según la instalación. Por ejemplo, si el servidor web tiene dos versiones de Python instaladas, la versión anterior se invoca con el comando <strong>python</strong> y la versión posterior se invoca a través del comando <strong>python2</strong>). </font></li>  <li><font size="-1">Debe conocer la ruta del directorio hacia su sitio. Si su servidor web aloja un sitio, la ruta puede ser <strong>var/www/html</strong>. Si tiene un servidor virtual que aloja varios sitios, la ruta puede ser del tipo <strong>home/virtual/site1/fst/var/www/html</strong>. </font></li>  <li><font size="-1"> Debe poder cargar archivos a su servidor web, por ejemplo, mediante FTP. </font></li>  <li><font size="-1">Si va a generar una lista de URL basadas en registros de acceso, debe conocer la codificación utilizada para estos registros y la ruta completa. </font></li>  </ul>   <p><font size="-1">Si tiene dudas sobre esta información, puede consultarlo con su empresa de alojamiento web. </font></p>  <font size="-1">  <p>Ahora ya está preparado para empezar. A continuación le ofrecemos una descripción general de lo que tendrá que hacer.</p>  </font>  <font size="-1">  <ol>  <li><font size="-1"><a href="#download">Descargue</a> los archivos de programa del Generador Sitemap. Extraiga los archivos a un directorio local. </font></li>  <li><font size="-1"><a href="#config">Cree un archivo de configuración</a> para su sitio con el archivo proporcionado <strong>example_config.xml</strong> como plantilla. Modifique este archivo como sea necesario y guárdelo. </font></li>  <li><font size="-1"><a href="#copy">Cargue los archivos necesarios</a> en su servidor web. </font></li>  <li><font size="-1"><a href="#execute">Ejecute</a> <strong>sitemap_gen.py</strong>. </font></li>  <li><font size="-1"><a href="http://www.google.com/support/webmasters/bin/answer.py?answer=34575&topic=8496">Añada</a> el Sitemap generado a su cuenta de Herramientas para webmasters de Google. </font></li>  <li><font size="-1"><a href="#recur">Configure una secuencia de comandos recurrente</a>. (opcional) </font></li>  </ol>  </font>   <p><font size="-1">Si no puede utilizar el Generador Sitemap, puede añadir un Sitemap a su cuenta de Herramientas para webmasters de Google en <a href="http://www.google.com/support/webmasters/bin/answer.py?answer=34606&topic=8516">otro formato</a>, como un archivo de texto. También puede obtener vínculos a programas de terceros que sean compatibles con Google Sitemaps <a href="http://code.google.com/sm_thirdparty.html">aquí</a>.</font></p>  <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="download"></a><b>1. Descarga de los archivos de programa del Generador Sitemap</b></td>  </tr>  </tbody></table>  <font size="-1">  <p>Los archivos del Generador Sitemaps están disponibles en formato ZIP y GZ en esta <font size="-1">ubicación:</font></p>  </font>  <p><font size="-1"><a href="http://www.sourceforge.net/project/showfiles.php?group_id=137793&amp;package_id=153422">http://sourceforge.net/project/showfiles.php?group_id=137793&amp;package_id=153422</a></font></p>  <font size="-1">  <p>Una vez que haya descargado el archivo, extráigalo a un directorio local. Busque los siguientes archivos:</p>  <ul>  <li><strong> README</strong>: contiene la información más reciente acerca de esta herramienta.</li>  <li><strong> sitemap_gen.py</strong>: es la secuencia de comandos Python que genera su Sitemap.</li>  <li><strong> example_config.xml</strong>: es el archivo de plantilla de configuración que debe usar para especificar la configuración de su sitio.</li>  <li><strong> example_urllist.txt</strong>: la plantilla de lista de URL que puede utilizar si desea crear un Sitemap basado en un grupo de URL que especifique.</li>  </ul>  </font>  <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="config"></a><b>2a. Creación de un archivo de configuración</b></td>  </tr>  </tbody></table>  <font size="-1">  </font><p><font size="-1">En esta sección se proporcionan instrucciones detalladas para crear un archivo de configuración. También se proporciona una <a href="#config_reference">referencia completa</a> de las opciones disponibles. Si crea <a href="http://www.google.com/support/webmasters/bin/answer.py?answer=34627&topic=8493">Sitemaps móviles</a>, consulte las <a href="#creating_mobile">directrices adicionales pertinentes</a>. </font></p>  <font size="-1"><p>Para poder crear un archivo de configuración para su sitio, debe disponer de la siguiente información:</p>  <ul>  <li>La URL base de su sitio, como <strong>http://www.example.com/sitemap.xml</strong>/. Asegúrese de incluir el protocolo, como <strong>http://</strong>. Por ejemplo, <strong>http://www.google.com</strong> es una URL base válida, pero <strong>www.google.com</strong> no lo es.</li>   
<li>La ruta del servidor web a la ubicación donde desea almacenar el Sitemap. Por lo general, ésta es la ruta a la URL base, dado que el Sitemap no puede contener URL que estén en un directorio de nivel superior a la ubicación del Sitemap. Cuando ejecute el Generador Sitemap de Google, creará el Sitemap y lo colocará en la ubicación que especifique.</li>   <li>Los métodos con los que desea que el Generador Sitemap cree su Sitemap. Puede emplear una combinación de métodos. Están disponibles los siguientes:</li>  </ul>   </font><ol> <ul>  <li><font size="-1"><strong> <a href="#URL">URL</a></strong>: enumera URL individuales de esta sección del archivo de configuración, junto con información acerca de cada una de las URL. Habitualmente, deberá emplear éste y otro método para incluir manualmente las URL que otros métodos no seleccionarían. </font></li>  <li><font size="-1"><strong><a href="#urllist">Lista de URL</a></strong>: indica el archivo de configuración de un archivo de texto que contiene una lista de URL. Le recomendamos que utilice este método si ya existe el archivo de texto o si utiliza una secuencia de comandos para generar una lista de URL. </font></li>  <li><font size="-1"><strong><a href="#directory">Rutas de directorio</a></strong>: especifican las rutas del directorio de su sitio y las URL que corresponden a esas rutas. El Generador Sitemap creará una lista de URL según los contenidos de esos directorios. Quizás desee utilizar este método si su sitio comprende archivos HTML estáticos. </font></li>  <li><font size="-1"><strong> <a href="#logs">Registros de acceso</a></strong>: apuntan a la ruta de sus archivos de registro. El Generador Sitemap creará una lista de URL en función de las URL incluidas en los registros. Quizás desee utilizar este método si su sitio comprende páginas dinámicas. </font></li>  <li><font size="-1"><strong> <a href="#sitemap">Sitemap</a></strong>: apunta a los Sitemaps que ha creado con el Generador Sitemap. Este cliente creará un solo Sitemap que incluya las URL de cada Sitemap. Puede utilizar este método si ya ha creado varios Sitemaps pequeños y desea combinarlos en uno de mayor tamaño. </font></li>  </ul>  </ol>   <font size="-1"><p><b><a name="create_config"></a>Para crear un archivo de configuración, siga estos pasos:</b></p>  </font>  <ol>  <font size="-1"> <li>Abra el archivo <strong>example_config.xml</strong> en un editor de textos. Guárdelo como un archivo nuevo (como <strong>config.xml</strong> o <strong>mysite_config.xml</strong>).</li>  </font>    <font size="-1">  <li>Busque la sección de definición del sitio:</li>  </font>   <pre>&lt;site 
base_url="http://www.example.com/" 
store_into="/var/www/docroot/sitemap.xml.gz"
verbose="1"&gt;</pre>   <font size="-1"><li>Cambie el valor <strong>base_url</strong> por la URL de su sitio.</li>   <li>Cambie el valor <strong>store_into</strong> por la ruta a su servidor web en el que desea almacenar el Sitemap y el nombre de archivo que desea utilizar para ese Sitemap. Generalmente, ésta es la ruta a la URL de base ya que Google únicamente puede aceptar URL situadas en el mismo nivel que el directorio del Sitemap o en subdirectorios de éste. Puede especificar una ruta relativa del directorio donde carga la secuencia de comandos o una ruta completa desde la raíz de su servidor web. Si carga la secuencia de comandos a su directorio URL base, basta con que especifique el nombre del archivo.</li>  </font>  <font size="-1"></font><font size="-1"><li>Busque las secciones de métodos de generación que comienzan con <span class="style1">** MODIFY</span> <span class="style1">or DELETE **</span>. Cada una de ellas corresponde a un método de generación de Sitemaps.</li>  <li>Suprima las secciones de los métodos que no va a utilizar.</li>  <li>Siga las instrucciones que encontrará a continuación relativas a los métodos que va a usar.</li>  <p><strong> URL<a name="URL"></a></strong></p>  <p>Busque la siguiente sección:</p>  </font>  <pre>&lt;!-- ** MODIFY or DELETE ** 
"url" nodes specify individual URLs to include in the map. &lt;br&gt;

Required attributes: 
href - the URL

Optional attributes: 
lastmod - timestamp of last modification (ISO8601 format) 
changefreq - how often content at this URL is usually updated
priority - value 0.0 to 1.0 of relative importance in your site 
--&gt; 

&lt;url href="http://www.example.com/stats?q=name" /&gt; 
&lt;url 
href="http://www.example.com/stats?q=age" 
lastmod="2004-11-14T01:00:00-07:00" 
changefreq="yearly" 
priority="0.3"
/&gt;</pre>  <font size="-1">  <p>En esta sección se ofrecen dos ejemplos: el primero sólo incluye el atributo necesario y el segundo contiene el atributo necesario además de los atributos opcionales.</p>  <p>Use este formato para cada una de las URL que desee incluir. El atributo <strong>changefreq</strong> brinda a Google una idea general de la frecuencia con la que se actualiza la URL. Esto ayuda a Google a conocer la frecuencia con la que debe visitar la página para ver el nuevo contenido. El atributo <strong>priority</strong> ofrece a Google información sobre la importancia relativa de esta página en comparación con las otras páginas del sitio. Este atributo no tiene ningún efecto sobre la forma en que Google compara su página con otras las páginas de otros sitios, sólo permite a Google saber qué páginas del sitio usted considera más importantes.</p>  </font>  <p><font size="-1"><strong> Lista de URL <a name="urllist"></a> </strong></font></p>  <font size="-1"><p>Busque la siguiente sección:</p>   </font>  <pre>&lt;!-- ** MODIFY or DELETE **
"urllist" nodes name text files with lists of URLs. 
An example file "example_urllist.txt" is provided. 

Required attributes: 
path - path to the file 

Optional attributes: 
encoding - encoding of the file if not US-ASCII 
--&gt; 
&lt;urllist path="example_urllist.txt" encoding="UTF-8" /&gt;</pre>   <p><font size="-1"> Use este formato para indicar la ruta y el nombre del archivo de texto que contiene su lista de URL. Puede usar el archivo <strong>example_urllist.txt </strong>proporcionado como plantilla para ese archivo de texto. Puede especificar una ruta relativa o una completa al servidor web. Por ejemplo, si el Generador Sitemap y el archivo <strong>urlist.txt </strong>se encuentran en el mismo directorio, basta con que especifique el nombre de archivo del archivo <strong> .txt</strong>. Si crea un archivo de texto con una codificación que sea UTF-8, puede utilizar el atributo <strong>encoding</strong> para indicar esta codificación. Si tiene varios archivos .txt, puede usar comodines. Por ejemplo:</font></p>  <pre>&lt;urllist path=&quot;example_urllist*.txt&quot; encoding=&quot;UTF-8&quot; /&gt;</pre>  <p><font size="-1">Para cada URL que incluya en el archivo de texto, puede especificar la última fecha de modificación, cambiar la frecuencia y la prioridad. Consulte la <a href="#urllist_reference">sección de referencia del archivo de texto URLlist</a> para obtener información completa sobre la estructura de este archivo.</font></p>  <p><font size="-1"><strong> Rutas de directorio<a name="directory"></a> </strong></font></p>  <p><font size="-1">Busque la siguiente sección: </font></p>   <pre>&lt;!-- ** MODIFY or DELETE ** 
"directory" nodes tell the script to walk the file system and 
include all files and directories in the Sitemap.

Required attributes:
path - path to begin walking from 
url - URL equivalent of that path 

Optional attributes:
default_file - name of the index or default file for directory URLs

--&gt; 
 &lt;directory  path=&quot;/var/www/icons&quot;    url=&quot;http://www.example.com/images/&quot; /&gt;<br>&lt;directory<br>path=&quot;/var/www/docroot&quot;<br>url=&quot;http://www.example.com/&quot;<br>default_file=&quot;index.html&quot;<br>/&gt;</pre>   <p><font size="-1">En esta sección se ofrecen dos ejemplos. Si todas sus páginas se encuentran dentro de los subdirectorios de una ruta, entonces únicamente tendrá que incluir una entrada. Sin embargo, si hay diversas rutas a las páginas de su sitio, incluya una entrada para cada una. </font></p>   <p><font size="-1">Recuerde que todas las URL deben comenzar con la URL base que especificó en el paso 3. Los ejemplos que se proporcionan en el archivo <strong>example_config.xml</strong> tienen URL que comienzan con <strong>http://www.example.com/</strong>. Por lo tanto, ambas URL son válidas. </font></p>   <p><font size="-1">Sustituya los ejemplos de entradas por entradas de su sitio. Muchos sitios sólo tendrán una entrada que apunta a la URL base. Asegúrese de que el valor <strong>path</strong> sea la ruta completa al directorio en su servidor web. Verifique que el valor <strong>url</strong> sea la URL completa, incluido el protocolo (como http) y una barra diagonal, si es necesario.</font></p>  <p><font size="-1">Puede utilizar el parámetro <strong>default_file</strong> para especificar el nombre de archivo que utiliza su servidor como la página predeterminada de un directorio. En el ejemplo anterior, <strong>/var/www/docroot</strong> se resuelve en <strong>http://www.example.com/index.html</strong>. No es necesario especificarlo. No obstante, si lo hace, el Generador Sitemap incluirá la página que se asigna a cada subdirectorio sólo una vez (en lugar de enumerar la URL del directorio y la URL del nombre del archivo) y utilizará la última fecha modificada del archivo (en lugar del directorio) para extraer el atributo lastmod (de la última modificación) de esa página. </font></p>  <p><font size="-1"><strong> Registros de acceso <a name="logs"></a></strong></font></p>  <p><font size="-1">Busque la siguiente sección: </font></p>  <pre>&lt;!-- ** MODIFY or DELETE **
&quot;accesslog&quot; nodes tell the script to scan webserver log files to
extract URLs on your site.  Both Common Logfile Format (Apache's default 
logfile) and Extended Logfile Format (IIS's default logfile) can be read.
				
Required attributes:
 path - path to the file
Optional attributes:
 encoding - encoding of the file if not US-ASCII
  --&gt;
&lt;accesslog path=&quot;/etc/httpd/logs/access.log&quot; encoding=&quot;UTF-8&quot; /&gt;
&lt;accesslog path=&quot;/etc/httpd/logs/access.log.0&quot; encoding=&quot;UTF-8&quot; /&gt;
&lt;accesslog path=&quot;/etc/httpd/logs/access.log.1.gz&quot; encoding=&quot;UTF-8&quot; /&gt;</pre>   <p><font size="-1">En esta sección se ofrecen tres ejemplos. Debe sustituir estas entradas e incluir una entrada para cada archivo de registro. Asegúrese de que el valor path sea la ruta completa y el nombre del archivo de su servidor web. Si los archivos de registro no están codificados como US-ASCII o UTF-8, utilice el atributo opcional de <strong>encoding</strong> para <a href="#encoding">especificar</a> la codificación. En lugar de enumerar cada uno de los archivos de registro, puede usar comodines. Por ejemplo, en los ejemplos anteriores podría incluir la siguiente entrada que incluiría los tres archivos de registro:</font></p> <pre>&lt;accesslog path=&quot;/etc/httpd/logs/access.log*&quot; encoding=&quot;UTF-8&quot; /&gt;</pre>  <p><font size="-1">El Generador Sitemap asigna prioridad a las URL que encuentra en los registros en función de la frecuencia de acceso a cada una de ellas. Por ejemplo, se otorgará mayor prioridad a una URL a la que se ha accedido 100 veces que a una a la que se ha accedido dos veces. La asignación real de prioridad es relativa y depende de cada URL en comparación con las demás URL del sitio.</font></p> <p><font size="-1"><strong> sitemap <a name="sitemap"></a></strong></font></p> <p><font size="-1">Busque la siguiente sección: </font></p>  <pre>&lt;!-- ** MODIFY or DELETE **<br>&quot;sitemap&quot; nodes tell the script to scan other Sitemap files. This can
be useful to aggregate the results of multiple runs of this script into
a single Sitemap.

Required attributes:
path - path to the file
--&gt;
&lt;sitemap path=&quot;/var/www/docroot/subpath/sitemap.xml&quot; /&gt;</pre>   <p><font size="-1">En esta sección se ofrece un ejemplo. Debe sustituir esta entrada e incluir una entrada para cada Sitemap que desee añadir. Asegúrese de que el valor sea la ruta completa y el nombre del archivo de su servidor web. También puede incluir Sitemaps en formato gzip si su extensión es .gz. En lugar de enumerar cada uno de los Sitemaps, puede usar comodines. Por ejemplo, la entrada siguiente incluiría todos los Sitemaps que empezaran por la palabra &quot;sitemap&quot; y tuvieran la extensión .xml:</font></p> <pre>&lt;sitemap path=&quot;/var/www/docroot/subpath/sitemap*.xml&quot; /&gt;</pre>  <p><font size="-1">El Generador Sitemap extrae todas las URL y los datos opcionales de cada una de ellas en cada Sitemap de la lista y crea un Sitemap con esta información. Por el momento, no podemos garantizar que este método funcione con los Sitemaps creados con herramientas distintas del Generador Sitemap.</font></p>     <font size="-1"><li>Busque la sección de definición de filtros:</li></font>   <pre>&lt;!-- ********************************************************         
FILTERS
				
Filters specify wild-card patterns that the script compares
against all URLs it finds. Filters can be used to exclude
certain URLs from your Sitemap, for instance if you have
hidden content that you hope the search engines don't find.

Filters can be either type=&quot;wildcard&quot;, which means standard
path wildcards (* and ?) are used to compare against URLs,
 or type=&quot;regexp&quot;, which means regular expressions are used
to compare.

Filters are applied in the order specified in this file.
An action=&quot;drop&quot; filter causes exclusion of matching URLs.
An action=&quot;pass&quot; filter causes inclusion of matching URLs,
shortcutting any other later filters that might also match.
If no filter at all matches a URL, the URL will be included.
Together you can build up fairly complex rules.

The default action is &quot;drop&quot;.
The default type is &quot;wildcard&quot;.

You can MODIFY or DELETE these entries as appropriate for
your site. However, unlike above, the example entries in
this section are not contrived and may be useful to you as
they are.
********************************************************* --&gt;

&lt;!-- Exclude URLs that end with a '~' (IE: emacs backup files) --&gt;
&lt;filter action=&quot;drop&quot; type=&quot;wildcard&quot; pattern=&quot;*~&quot; /&gt;

&lt;!-- Exclude URLs within UNIX-style hidden files or directories --&gt;
&lt;filter action=&quot;drop&quot; type=&quot;regexp&quot; pattern=&quot;/\.[^/]*&quot; /&gt;</pre>  <p><font size="-1">Puede usar el filtro para excluir URL concretas del Sitemap que ha creado. Le recomendamos que cree una lista más clara para reducir listados redundantes, así como para evitar la indexación de determinadas URL. Tenga en cuenta que si usa un archivo <a href="http://www.robotstxt.org/wc/robots.html">robots.txt</a> para evitar la indexación de URL, podría ocurrir que, incluso si las URL están incluidas en su Sitemap, Google no realice búsquedas de ellas ni las indexe. </font></p>   <p><font size="-1"> Puede utilizar cualquiera o todos los métodos de filtrado. Puede eliminar las entradas que no necesite y crear entradas adicionales, si así lo desea. A continuación se incluyen ejemplos de usos. </font></p>  <pre>&lt;filter action=&quot;drop&quot; type=&quot;wildcard&quot; pattern=&quot;*.jpg&quot; /&gt;</pre>  <p><font size="-1">Este filtro excluye las URL cuya extensión es .jpg. Le recomendamos que incluya un filtro similar si todas las imágenes de su sitio están incrustadas en páginas HTML y no debe accederse a ellas como URL independientes. </font></p>  <pre>&lt;filter action=&quot;pass&quot; type=&quot;wildcard&quot; pattern=&quot;*.htm*&quot; /&gt;
&lt;filter action=&quot;drop&quot; type=&quot;wildcard&quot; pattern=&quot;*&quot; /&gt;</pre><font size="-1"> Este filtro incluye todos los archivos .htm* pero excluye todo lo demás.</font><br>  <br>    <font size="-1"></font><font size="-1"><li>Una vez que haya realizado todos los cambios en su sitio, guarde el archivo.</li></font>  </ol>    <font size="-1"><a name="config_reference"></a><p><b>Referencia sintáctica del archivo de configuración</b></p>  </font><font size="-1">  </font>  <p><font size="-1">A continuación encontrará una explicación completa de toda la sintaxis del archivo de configuración. Todos los códigos comienzan con una código de muestra seguido de una descripción de los atributos. </font></p>   <p><font size="-1"><strong><a name="sitetag"></a>site<br></strong></font><font size="-1">Código necesario al principio de cada uno de los archivos de configuración. </font></p>  <pre>&lt;site
base_url="http://www.example.com/"
store_into="/var/www/html/sitemap.xml.gz"
verbose="1"
supress_search_engine_notify="1"
default_encoding="UTF-8"&gt;</pre>  <br>  <font size="-1">  <table border="1" cellpadding="2" cellspacing="0" width="100%">   <tbody><tr>  <td valign="top" width="19%"><pre>base_url</pre></td>  <td valign="top" width="6%"><font size="-1">obligatorio</font></td>  <td valign="top" width="75%"><font size="-1">La ruta HTTP de la base de su sitio web: sólo las URL que comienzan con esta base pueden incluirse en el Sitemap</font></td>  </tr>   <tr>  <td valign="top"><pre>store_into</pre></td>  <td valign="top"><font size="-1">obligatorio</font></td>  <td valign="top"><font size="-1">La ruta al servidor web del archivo de resultado deseado. La secuencia de comandos creará este archivo, de modo que no es necesario crearlo antes de ejecutar la secuencia.</font></td>  </tr>   <tr>  <td valign="top"><pre>verbose</pre></td>  <td valign="top"><font size="-1">opcional</font></td>  <td valign="top"><font size="-1">Introduzca un número de 0 a 3; los números más altos se corresponderán a un incremento de información de depuración</font></td>  </tr>   <tr>  <td valign="top"><pre>suppress_search_engine_notify</pre></td>  <td valign="top"><font size="-1">opcional</font></td>  <td valign="top"><font size="-1"></font><font size="-1">Inhabilite la notificación del motor de búsqueda introduciendo "1" para poder realizar pruebas</font></td>  </tr>   <tr>  <td valign="top"><pre>default_encoding</pre></td>  <td valign="top"><font size="-1">opcional</font></td>  <td valign="top"><font size="-1">Especifique la codificación de caracteres que debe aplicarse a las rutas del sistema de archivos y a las URL</font></td>  </tr>   </tbody></table>  </font>  <font size="-1">   <p></p>  </font>  <p><font size="-1"><strong>url<br></strong></font><font size="-1">Código opcional que puede usar para enumerar las URL de su sitio. </font></p>  <p><pre>&lt;url
href="http://www.example.com/stats?q=age" 
lastmod="2004-11-14T01:00:00-07:00" 
changefreq="yearly" 
priority="0.3"
/&gt;</pre></p><table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td height="20" valign="top" width="19%"><pre>href</pre></td>  <td width="6%" valign="top"><font size="-1">obligatorio</font></td>  <td valign="top" width="75%"><font size="-1">La ruta HTTP de la base de su sitio web: sólo las URL que comienzan con esta base pueden incluirse en el Sitemap</font></td>  </tr><tr>  <td valign="top"><pre>lastmod</pre></td>  <td valign="top"><font size="-1">opcional</font></td>  <td valign="top"><font size="-1">La fecha de la última modificación de la URL en formato <a href="http://www.w3.org/TR/NOTE-datetime">W3C de fecha y hora</a> (AAAA-MM-DDThh:mm:ss+00:00). Puede omitir la parte referente al tiempo. Ejemplos:<br>&nbsp;&nbsp;"2005-02-21T18:00:15+00:00"<br>&nbsp;&nbsp;"2005-02-21"</font></td>  </tr><tr>  <td valign="top"><pre>changefreq</pre></td>  <td valign="top"><font size="-1">opcional</font></td>  <td valign="top"><font size="-1">La frecuencia con la que la URL puede modificarse. Esto se considera una sugerencia, por lo que no es obligatorio.  El valor debe ser "always", "hourly", "daily", "weekly", "monthly", "yearly" o "never".</font></td>  </tr><tr>  <td valign="top"><pre>priority</pre></td>  <td valign="top"><font size="-1">opcional</font></td>  <td valign="top"><font size="-1">La prioridad de esta página es relativa, en función de las demás páginas del mismo sitio. El valor es un número entre 0,0 y 1,0, donde 0,0 es la prioridad más baja y 1,0 es la prioridad más alta. La prioridad puede afectar al orden en que los motores de búsqueda seleccionan las URL para explorar su sitio. Dado que la prioridad es relativa, sólo se utiliza para elegir entre las URL de su sitio; la prioridad de sus páginas no se comparará con la de las páginas de otros sitios.</font></td>  </tr>  </tbody></table>  <p><font size="-1"><b>urllist<br></b></font><font size="-1">Código opcional que puede utilizar para indicar un archivo de texto que contiene una lista de las URL de su sitio. </font></p>  <pre>&lt;urllist path="/var/www/html/urllist.txt" encoding="UTF-8" /&gt;</pre>  <br>  <table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td height="20" valign="top" width="19%"><pre>path</pre></td>  <td width="6%" valign="top"><font size="-1">obligatorio</font></td>  <td valign="top" width="75%"><font size="-1">La ruta y el nombre de archivo del archivo .txt. Puede especificar una ruta relativa o una completa. </font></td>  </tr><tr>  <td valign="top"><pre>encoding</pre></td>  <td valign="top"><font size="-1">opcional</font></td>  <td valign="top"><font size="-1">La codificación del archivo, si no se trata de UTF-8.</font></td>  </tr>  </tbody></table> <p><font size="-1"><a name="urllist_reference"></a><b>urllist.txt</b> es un archivo en formato de texto simple que contiene una lista de todas las URL que deben asignarse. También puede incluir atributos opcionales para cada URL, los cuales se introducen en la misma línea que la URL y separados por un único espacio. Por ejemplo,</font></p>  <pre>http://www.example.com/abc/something
http://www.example.com/abc/xyy.pdf lastmod=2001-12-31T14:05:06+00:00
http://www.example.com/abc/def?x=12&amp;y=23 changefreq=weekly priority=0.3</pre>  <p>  <font size="-1">   </font><table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td width="19%" valign="top"><pre>lastmod</pre></td>  <td valign="top" width="6%"><font size="-1">opcional</font></td>  <td width="75%" valign="top"><p><font size="-1">La fecha de la última modificación de la URL en formato <a href="http://www.w3.org/TR/NOTE-datetime">W3C de fecha y hora</a> (AAAA-MM-DDThh:mm:ss+00:00). Puede omitir la parte referente al tiempo. Ejemplos:</font><font size="-1"><br>  <br>&nbsp;&nbsp;"2005-02-21T18:00:15+00:00"<br>&nbsp;&nbsp;"2005-02-21"</font></p>  </td>  </tr><tr>  <td valign="top"><pre>changefreq</pre></td>  <td valign="top"><font size="-1">opcional</font></td>  <td valign="top"><font size="-1"><font size="-1">La frecuencia con la que la URL puede modificarse. Esto se considera una sugerencia y no un comando. El valor debe ser "always", "hourly", "daily"", "weekly", "monthly", "yearly" o "never".</font></font></td>  </tr><tr>  <td valign="top"><pre>priority</pre></td>  <td valign="top"><font size="-1">opcional</font></td>  <td valign="top"><font size="-1">La prioridad de esta página es relativa, en función de las demás páginas del mismo sitio. El valor es un número entre 0,0 y 1,0, donde 0,0 es la prioridad más baja y 1,0 es la prioridad más alta. La prioridad puede afectar al orden en que los motores de búsqueda seleccionan las URL para explorar su sitio. Dado que la prioridad es relativa, sólo se utiliza para elegir entre las URL de su sitio; la prioridad de sus páginas no se comparará con la de las páginas de otros sitios.</font></td>  </tr>  </tbody></table>  </p>  <font size="-1">  </font>  <p><font size="-1"><strong>directory<br></strong></font><font size="-1">Código opcional que puede usar para especificar directorios en su sitio de modo que el Generador Sitemap pueda crear una lista de URL de los archivos que encuentre en estos directorios. </font></p>  <pre>--&gt; 
 &lt;directory  path=&quot;/var/www/icons&quot;    url=&quot;http://www.example.com/images/&quot; /&gt;<br>&lt;directory<br>path=&quot;/var/www/docroot&quot;<br>url=&quot;http://www.example.com/&quot;<br>default_file=&quot;index.html&quot;<br>/&gt;</pre>  <table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td width="19%" valign="top"><pre>path</pre></td>  <td valign="top" width="6%"><font size="-1">obligatorio</font></td>  <td width="75%" valign="top"><font size="-1">Establece la ruta inicial. El Generador Sitemap recorrerá este directorio y todos los subdirectorios</font>.</td>  </tr>   <tr>  <td valign="top"><pre>url</pre></td>  <td valign="top"><font size="-1">obligatorio</font></td>  <td valign="top"><font size="-1">Especifica la URL que equivale al valor de la ruta.</font></td>  </tr>  <tr>  <td valign="top"><pre>default_file</pre></td>  <td valign="top"><font size="-1">opcional</font></td>  <td valign="top"><font size="-1">Especifica el archivo predeterminado de un directorio en el servidor.</font></td>  </tr>  </tbody></table>  </font>  <p><font size="-1"><b> accesslog<br></b>Código opcional que puede usar para especificar la ruta y el nombre de archivo de los registros de acceso IIS y Apache de modo que el Generador Sitemap pueda seleccionar las URL de manera automática. </font></p>   <pre>&lt;accesslog path="/etc/httpd/logs/access-0.log" encoding="UTF-8"/&gt;</pre>  <table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td width="19%" valign="top"><pre>path</pre></td>  <td valign="top" width="6%"><font size="-1">obligatorio</font></td>  <td width="75%" valign="top"><font size="-1">Indica la ruta del archivo.</font></td>  </tr>   <tr>  <td valign="top"><pre>encoding</pre></td>  <td valign="top"><font size="-1">opcional</font></td>  <td valign="top"><font size="-1">Especifica la codificación del archivo, si no se trata de UTF-8.</font></td>  </tr>  </tbody></table>    <p><font size="-1"><b> sitemap<br></b>Código opcional que puede utilizar para especificar la ruta y el nombre de archivo de los Sitemaps que ha creado con el Generador Sitemap. Este cliente creará un solo Sitemap que incluya las URL de cada Sitemap. </font></p>   <pre>&lt;ruta de sitemap=&quot;/var/www/raízdoc/subruta/sitemap.xml&quot; /&gt;</pre>  <table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td width="19%" valign="top"><pre>path</pre></td>  <td valign="top" width="6%"><font size="-1">obligatorio</font></td>  <td width="75%" valign="top"><font size="-1">Indica la ruta del archivo de Sitemap.</font></td>  </tr>  </tbody></table>    <p><font size="-1"><strong><a name="filter_examples"></a>filter<br></strong></font><font size="-1">Código opcional que puede usar para establecer reglas que incluyan o excluyan archivos específicos. Los filtros se cumplen en función de su orden de aparición en el archivo config.xml. Sin embargo, las entradas de archivos entremezcladas y las de entrada (url, urllist, directory o accesslog) no tiene efecto adicional; todas las URL que el Generador Sitemap añade al Sitemap se compara primero con cada uno de los filtros. </font><font size="-1">Si ningún filtro coincide con la URL, se incluirá la URL en el Sitemap de manera predeterminada.</font></p>   <pre>&lt;filter action="drop" type="wildcard" pattern="*/internal/*" /&gt;</pre>  <table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td width="19%" valign="top"><pre>action</pre></td>  <td valign="top" width="6%"><font size="-1">opcional</font></td>  <td width="75%" valign="top">  <font size="-1"><p>La acción que debería realizar el filtro. Valores aceptados:</p>  </font> <ul>  <li><font size="-1">drop: excluye la concordancia de URL. Ésta es la acción predeterminada, por lo que, si no se especifica ninguna otra acción, el generador asume &quot;drop&quot;.</font></li>  <li><font size="-1">pass: incluye las URL que coinciden.</font></li>  </ul>  </p></td>  </tr>   <tr>  <td width="19%" valign="top"><pre>type</pre></td>  <td valign="top" width="6%"><font size="-1">opcional</font></td>  <td width="75%" valign="top"><font size="-1"><p>El tipo de filtro. Valores aceptados:</p>  </font> <ul>  <li><font size="-1">wildcard: ruta estándar con comodines (¿ y *), se usan para compararlos con las URL. Éste es el tipo predeterminado, por lo que, si no se especifica ningún otro tipo, el generador asume &quot;wildcard&quot;.</font></li>  <li><font size="-1">regexp: se utilizan expresiones comunes.</font></li>  </ul></td>  </tr>  <tr>  <td valign="top"><pre>pattern</pre></td>  <td valign="top"><font size="-1">obligatorio</font></td>  <td valign="top"><font size="-1">Especifica el modelo que es preciso seguir.</font></td>  </tr>  </tbody></table>  <font size="-1"> <p><b><a name="encoding"></a>Codificaciones</b></p>   <p>Los archivos a los que hace referencia su archivo de configuración, las listas de URL o los registros del servidor web pueden utilizar codificaciones distintas de la codificación predeterminada UTF-8. Puede especificar otras codificaciones en config.xml para afectar la forma en que el Generador Sitemap lee sus archivos. Algunas de las codificaciones más frecuentes son:</p>  <ul>  <li><strong>encoding="utf-8"</strong> es el supuesto valor predeterminado</li><li><strong>encoding="ascii</strong>" es un subgrupo de UTF-8, por lo que no necesita especificarlo.</li><li><strong>encoding="iso-8859-1</strong>" es común para muchos idiomas de Europa occidental</li></ul>  </font>   <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="creating_mobile" id="creating_mobile"></a><b>2b. Información adicional para crear un archivo de configuración móvil</b></td>  </tr>  </tbody></table>  <p><font size="-1">Los archivos de configuración de un Sitemap móvil se crean de la misma forma que los de un Sitemap no móvil. No obstante, debe crear un archivo de configuración distinto para cada lenguaje de marcas y ejecutar el Generador Sitemap para cada archivo de configuración por separado, con el fin de crear un Sitemap distinto para cada uno.</font></p>  <p><font size="-1">Cada archivo de configuración debe:</font></p>  <ul>  <li><font size="-1">Especifique un nombre de archivo diferente para el valor <a href="#create_config"><strong>store_into</strong></a>.</font></li>  <li><font size="-1">Use <a href="#filter_examples">filtros</a> para especificar las URL que deben excluirse e incluirse para el lenguaje de marcas. Recuerde que cada Sitemap debe incluir URL para un lenguaje de marcas solamente. Esto significa que la misma URL puede estar incluida en varios Sitemaps, si las URL en cuestión muestran varios lenguajes de marcas.</font></li>  </ul>  <p><strong><font size="-1">Ejemplos de filtrado</font></strong></p>  <p><font size="-1">A continuación le mostramos algunos ejemplos de cómo puede utilizar filtros basados en la extensión para generar Sitemaps móviles para los diferentes lenguajes de marcas. El filtrado específico que utilice debe estar basado en los tipos de lenguajes de marcas que emplea en su sitio y en cómo especifica cada tipo. Si ha implementado los detalles de su sitio de forma diferente (por ejemplo, puede organizar URL con diferentes lenguajes de marcas en carpetas diferentes), debe filtrar en función de la información específica de la implementación de su sitio. Recuerde que los filtros se aplican en el orden en que se especifican en el archivo de configuración. Por lo tanto, el primer filtro que debe enumerar es una acción "pass" que especifique las URL que desea incluir en el Sitemap. </font></p>  <p><font size="-1">Para crear un Sitemap para contenido WML (WAP 1.2):</font></p>   <pre>&lt;filter action="pass" type="wildcard" pattern="*.wml" /&gt;
&lt;filter action="drop" type="wildcard" pattern="*.*" /&gt;<br>
</pre>   <p><font size="-1">Para crear un Sitemap para el contenido del perfil móvil XHTML (WAP 2.0):</font></p>   <pre>&lt;filter action="pass" type="wildcard" pattern="*.xhtml" /&gt;
&lt;filter action="drop" type="wildcard" pattern="*.*" /&gt;<br>
			</pre>  <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="copy"></a><b>3. Carga de los archivos a su servidor web</b></td>  </tr>  </tbody></table>  <p><font size="-1"> Debe cargar los siguientes archivos en su servidor web en una ubicación a la que pueda acceder desde una línea de comandos: </font></p>   <font size="-1"><ul>  <li><strong> config.xml</strong>: es el archivo de configuración que ha creado usando<strong>example_config.xml</strong>.</li>  <li><strong> sitemap_gen.py</strong>: es la secuencia de comandos que genera su Sitemap.</li>  <li><strong> urllist.txt</strong>: este archivo es opcional, sólo necesita incluirlo si utilizó el método de archivo de texto para crear un Sitemap.</li>  </ul>   </font>  <p><font size="-1"> El método que debe usar para cargar estos archivos depende de su entorno. Los métodos más habituales incluyen <a href="http://www.google.com/search?q=ftp">FTP</a> y SCP. Si desea obtener más información, póngase en contacto con su host web. </font></p>   <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="execute"></a><strong>4. Ejecución de la secuencia de comandos (sitemap_gen.py) </strong></td>  </tr>  </tbody></table>   <p><font size="-1"> Para poder ejecutar el Generador Sitemap, tendrá que conectarse a su servidor web. El método que debe usar para conectarse depende de su entorno. Por ejemplo, generalmente puede acceder a un servidor basado en UNIX utilizando <a href="http://www.google.com/search?q=ssh">SSH</a>. Para obtener más información acerca de la conexión a su servidor web y de la ejecución de secuencias de comandos, consulte con su host web. </font></p>   <p><font size="-1"> Una vez que haya copiado los archivos en su servidor web, necesitará ejecutar la secuencia de comandos del Generador Sitemap. Conéctese a su servidor web y ejecute el siguiente comando (reemplace <strong>&lt;path/config.xml&gt;</strong> por la ruta y el nombre de su archivo de configuración; si ha cargado este archivo en la misma ubicación que la secuencia de comandos Python, puede excluir la ruta):</font></p>   <pre>python sitemap_gen.py --config=&lt;path/config.xml&gt</pre> <p><font size="-1">Por ejemplo, una línea de comandos basada en UNIX puede tener un aspecto parecido a éste:</font></p> <p><img src="images/python_command.gif" alt="Comando Python"></p> <p><font size="-1">Un shell de comandos basado en MS-DOS puede tener un aspecto similar a éste:</font></p> <p><img src="images/python_dos.gif" alt="Comando Python"></p> <p><font size="-1"><b>Sugerencia:</b> Si está probando su configuración y no está preparado para enviar su Sitemap, la sintaxis que encontrará a continuación evitará que el Generador Sitemap contacte con Google:</font></p>  <pre><br>$ python sitemap_gen.py --config=config.xml --prueba</pre>  <font size="-1"><p>Verá el estado de sus solicitudes en el símbolo del sistema:</p></font> <pre>Reading configuration file: /path/config.xml
	Opened URLLIST "/path/urllist.txt"
	Walking DIRECTORY "/var/www/html/dir"
	Walking DIRECTORY "/var/www/html/dir2"
	Opened ACCESSLOG "/etc/httpd/logs/access-0.log"
	Sorting and normalizing collected URLs.
	Writing Sitemap file "/path/sitemap.xml.gz" with 1092 URLs
	Notifying search engines.
	Notifying www.google.com
	Count of file extensions on URLs:
		208  .html
		574  .jpg
		...
		Number of errors: 0
		Number of warnings: 0</pre>  <font size="-1">  <p>Si no ve muchos resultados como éste, recuerde que la configuración verbose de su archivo de configuración afecta a la cantidad de información que aparece en la pantalla. Este ejemplo es representativo de la configuración verbose en "1".</p>  <p>Asimismo, se informará de cualquier error en el archivo. Por ejemplo, si no incluye el atributo url= en una entrada de directorio, la secuencia de comandos devolverá lo siguiente:</p></font> <pre>[ERROR] Directory entries must have both "path" and "url" attributes
	Number of errors: 1</pre>  <font size="-1">  </font>  <p><font size="-1">Corrija los errores de su archivo <b>config.xml</b> y vuelva a ejecutar la secuencia de comandos. Si no hay ningún error, el Generador Sitemap creará un nuevo archivo <b>sitemap.xml.gz</b> en la ubicación que especificó en el archivo de configuración. </font></p>  <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="submitting" id="submitting"></a><strong>5. Envío de su Sitemap a Google </strong></td>  </tr>  </tbody></table>  <p><font size="-1">El Generador Sitemap crea un archivo <strong>sitemap.xml.gz</strong> en la ubicación especificada en el archivo de configuración. Una vez que haya creado este archivo correctamente, asegúrese de que se pueda acceder a él a través de un navegador web. A continuación, <a href="http://www.google.com/support/webmasters/bin/answer.py?answer=34575&topic=8496">añádalo</a> a su cuenta de <a href="https://www.google.com/webmasters/sitemaps/siteoverview">Google Sitemaps</a>. De esta forma, Google le ofrecerá información estadística y sobre el estado del Sitemap que le será de gran utilidad. Si Google informa de problemas relacionados con su Sitemap, puede corregirlos y volver a enviarlo. Sólo debe añadir el Sitemap manualmente una vez. A continuación, puede utilizar una <a href="submit.html#ping">solicitud HTTP</a> para notificar a Google los cambios en su Sitemap (aunque también puede volver a enviarlo a través de la cuenta de Herramientas para webmasters de Google). </font></p>   <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="recur"></a><b>6. Configuración de una secuencia de comandos recurrente</b></td>  </tr>  </tbody></table>  <font size="-1">  <p>Le recomendamos configurar el Generador Sitemap para que se ejecute con la misma frecuencia con que cambian su contenidos, a una frecuencia máxima de una vez por hora.</p>  </font>  <p><font size="-1">Es recomendable que los webmasters con un servidor web UNIX consideren configurarlo como una <a href="http://www.google.com/search?q=cron">tarea cron</a>. </font></p>  <font size="-1"><p>Los webmasters que utilizan otras plataformas deben ponerse en contacto son su administrador del sistema para obtener ayuda en la configuración de secuencias de comandos recurrentes. También puede obtener asesoramiento en el grupo Google Sitemaps en <a href="http://www.google.com/webmasters/sitemaps/googlegroup?hl=es">Grupos de Google</a>.</p>   </font>  <p><font size="-1"> Puede usar una <a href="submit.html#ping">solicitud HTTP</a> para informar a Google de los cambios de su Sitemap. No obstante, por favor, asegúrese de acceder una sola vez a la cuenta de <a href="https://www.google.com/webmasters/sitemaps/siteoverview">Herramientas para webmasters de Google</a> con los datos de Cuentas de Google para <a href="http://www.google.com/support/webmasters/bin/answer.py?answer=34575&topic=8496">añadir su Sitemap</a> manualmente.</font></p>  <font size="-1"></font>  <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="troubleshoot"></a><b>Solución de problemas</b></td>  </tr>  </tbody></table>  <font size="-1">  <p>En esta sección, describiremos algunos de los problemas o dudas más frecuentes con las que algunos usuarios se enfrentan al utilizar el Generador Sitemap, así como las acciones que los resuelven.</p>  <p><b>Accesible por Internet</b></p>  <p><b>Problema:</b> el Generador Sitemap devuelve el siguiente error y advertencia:</p>  </font> <pre>[ERROR] When attempting to access your generated Sitemap at the following URL:
	http://www.example.com/sitemap.xml.gz
	we failed to read it.  Please verify the store_into path you specified in
	your configuration file is web-accessible.  Consult the FAQ for more
	information.
	[WARNING] Proceeding to notify with an unverifiable URL.</pre>  <font size="-1">  <p><b>¿Qué ha pasado?</b> El Generador Sitemap ha creado el archivo donde usted especificó; a continuación, ha intentado recuperarlo usando HTTP tal y como haría un motor de búsqueda y no lo ha encontrado. De todos modos, lo ha comunicado a los motores de búsqueda, pero genera el error para avisarle de que los motores de búsqueda no pueden leer su Sitemap.</p>  <p>El Generador Sitemap crea su archivo de Sitemap en la ruta especificada en el atributo store_into de su archivo <b>config.xml</b>. A continuación, dicho cliente genera una URL a ese archivo utilizando el atributo base_url e informa de la URL a los motores de búsqueda. Por ejemplo, si la configuración es:</p>  </font> <pre>&lt;site base_url="http://www.example.com/"
	      store_into="/var/www/html/sitemap.xml.gz"&gt;</pre>  <font size="-1">  </font><p><font size="-1">El Generador Sitemap indicará a los motores de búsqueda que realicen la búsqueda de su Sitemap en:</font></p>   <pre>http://www.example.com/sitemap.xml.gz</pre>  <font size="-1"><p>Se debe poder acceder al archivo a través de esta URL. Si no se puede recuperar el archivo utilizando esta URL, los motores de búsqueda no podrán encontrar su Sitemap.</p>  </font><p><font size="-1"><b>¿Qué puede hacer?</b> Tiene que verificar que su <b>config.xml</b> está especificando las rutas base_url y store_into correctas para su Sitemap. También debe confirmar que los exploradores web pueden recuperar el archivo de Sitemap de base_url. Sin detecta errores en la ruta o la URL, deberá volver a ejecutar el Generador Sitemap o simplemente trasladar el archivo de Sitemap a la ubicación correcta y notificárselo a los motores de búsqueda manualmente a través de sus sitios web. </font></p>  <font size="-1"><p><b>Compatibilidad con XML</b></p>  <p><strong>Problema:</strong> El Generador Sitemap informa del siguiente error:</p>  </font> <pre>Some installs of Python 2.2 do not include complete support for XML. 
	Please try upgrading your version of Python and re-running the script.</pre>  <font size="-1"><p><b>¿Qué ha pasado?</b> Como indica el mensaje, algunas plataformas tienen una versión de Python (el lenguaje en que está escrita la secuencia de comandos del Generador Sitemap) que no cuenta con bibliotecas compatibles necesarias para procesar archivos XML. Esta secuencia requiere compatibilidad total con XML para ejecutarse.</p>  <p><b>¿Qué puede hacer?</b> Pruebe a actualizar la versión de Python que tiene instalada. Para ello, seguramente tendrá que ponerse en contacto con su administrador del sistema.</p>  <p>Tenga en cuenta que esto sólo afecta al Generador Sitemap, no a todo el programa Sitemaps. Si dispone de otro método o herramienta para la creación de Sitemaps, no dude en utilizarlo y enviar sus Sitemaps a los motores de búsqueda.</p>  <p><b>¿Cuáles son los archivos extra en .gz o .zip?</b></p>  <p>Al extraer la secuencia de comandos sitemap_gen.py, probablemente vea algunos archivos más de los que mencionamos anteriormente. La lista completa de archivos se asemeja más a la siguiente:</p>  </font>  <pre>AUTHORS
	ChangeLog
	COPYING
	example_config.xml
	example_urllist.txt
	PKG-INFO
	README
	setup.py
	sitemap_gen.py
	test_sitemap_gen.py</pre>  <font size="-1"><p>Los archivos adicionales tienden a contener información sobre el paquete y los términos de la licencia. Se recomienda consultarlos.</p>  <p>La única excepción es test_sitemap_gen.py, una secuencia de comandos de bloque de prueba que otros desarrolladores pueden encontrar útil si desean contribuir en este proyecto de código abierto. Si pretende utilizar el Generador Sitemap sin modificar ninguno de los códigos fuente, lo que se supone que deseará la mayoría de los usuarios, seguramente no necesitará esta secuencia de comandos de prueba.</p>Si está interesado en colaborar con nosotros en este proyecto, por favor, visite <a href="http://sourceforge.net/projects/goog-sitemapgen">http://sourceforge.net/projects/goog-sitemapgen</a>. Asimismo, <a href="http://code.google.com/sm_thirdparty.html">aquí</a> encontrará vínculos hacia programas de terceros que admiten Google Sitemaps.</p>   <font size="-1"></font></font>  <p><font size="-1"><b><a name="nonascii"></a>Caracteres de un código distinto de ASCII </b></font></p>  <font size="-1"><font size="-1">  </font></font>  <p><font size="-1"><strong>Problema:</strong> El nombre de dominio de su sitio o las URL que contiene incluyen caracteres de código distinto de ASCII.</font></p>  <p><font size="-1">Por lo general, las URL con un código distinto de ASCII deben <a href="protocol.html#escaped">codificarse con UTF-8</a> antes de contener caracteres de escape con porcentaje. Sin embargo, algunos servidores web sólo responden correctamente si las URL están codificadas con un tipo de codificación distinto de UTF-8. Todas las URL que contiene su Sitemap, así como la del propio Sitemap, deben estar codificadas para que el servidor web en el que están ubicadas las pueda leer. En la <a href="#sitetag">sección de definición del sitio</a>, utilice el atributo opcional <strong>default_encoding</strong> para especificar la codificación que utiliza su servidor web. Si no utiliza este código y su servidor web emplea una codificación distinta de UTF-8, no sabremos qué codificación debemos utilizar.</font></p>  <p><font size="-1">Si sus URL contienen caracteres de un código distinto de ASCII, le recomendamos que ejecute la secuencia de comandos del Generador Sitemap mediante Python 2.3 o superior. Esta versión de Python ha incrementado el soporte para los caracteres de código distinto de ASCII. Si su nombre de dominio contiene caracteres de código distinto de ASCII, debe utilizar Python 2.3 o superior, puesto que las versiones anteriores no admiten los Internationalizing Domain Names in Applications (IDNA). Sin la compatibilidad con IDNA, el Generador Sitemap no puede codificar correctamente un nombre de dominio con caracteres de código distinto de ASCII. </font></p>  <font size="-1">     <br>  <p class="d" align="right"><i>Última modificación: 15 de abril de 2006</i></p>  </font></div>  </td>  </tr>  <tr>  <td width="1%" valign="top"><img src="http://www.google.com/images/art.gif" width="143" height="53" vspace="5" hspace="15"></td>  <td style="background-color: #ffffff" width="1" valign="top"><img src="http://www.google.com/images/cleardot.gif" width="1" height="1"></td>  <td style="background-color: #ffffff" width="10" valign="top"><img src="http://www.google.com/images/cleardot.gif" width="1" height="1"></td>  <td valign="middle"><div class="footer">  <div align="center"><font size="-1"> &copy;2007 Google - <a href="http://www.google.com/privacy.html">Política de privacidad</a> - <a href="http://www.google.com/accounts/TOS">Términos y condiciones</a> - <a href="http://www.google.com/about.html">Acerca de Google</a> </font></div>  </div></td>  </tr> </table> </body> </html>  